检索结果

期刊

出版年

关键词

Please wait a minute...

选择:

导出引用
EndNote Ris BibTeX

显示/隐藏图片

Select

1. 基于面部特征图对称的人脸正面化生成对抗网络算法

李虹霞, 秦品乐, 闫寒梅, 曾建潮, 鲍骞月, 柴锐

计算机应用 2021, 41 (3): 714-720. DOI: 10.11772/j.issn.1001-9081.2020060779

摘要（603）

PDF （1432KB）（696）

目前人脸正面化研究主要解决人脸偏转问题，而对监控视频等现实场景中同时受偏转和俯仰变化影响的侧脸的正面化生成关注较少，针对这个问题和多角度侧脸生成的正面人脸图存在身份信息保留不全的问题，提出了一种基于特征图对称模块和眼周特征保留损失的生成对抗网络（GAN）。首先，根据人脸对称性先验，提出特征图对称模块，先使用人脸关键点检测器检测出侧脸鼻尖点位置，再将编码器提取到的特征图依照鼻尖位置进行镜像对称，从而在特征层面上缓解面部信息缺失的问题。其次，借鉴眼周识别思想，在现有的生成图身份保留方法中加入了眼周特征保留损失以训练生成器生成逼真的且保留身份信息的人脸正面图像。实验结果表明，所提算法得到的生成图面部细节保留较好，且在CAS-PEAL-R1数据集的所有俯角下人脸的平均Rank-1识别率为99.03%，可见该算法能够有效解决多角度侧脸的正面化问题。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于梅尔倒谱系数、深层卷积和Bagging的环境音分类方法

王天锐, 鲍骞月, 秦品乐

计算机应用 2019, 39 (12): 3515-3521. DOI: 10.11772/j.issn.1001-9081.2019040678

摘要（309）

PDF （991KB）（321）

针对传统环境音分类模型对环境音特征提取不充分，以及卷积神经网络用于环境音分类时全连接层易造成过拟合现象的问题，提出了梅尔倒谱系数（MFCC）、深层卷积和Bagging算法相结合的环境音分类方法。首先，针对原始音频文件，利用预加重、加窗、离散傅里叶变换、梅尔滤波器转换、离散余弦映射等方法建立梅尔倒谱系数特征模型；然后，将特征模型输入卷积深度网络进行第二次特征提取；最后，借鉴强化学习思想，用Bagging集成算法集成线性判别分析器、支持向量机（SVM）、Softmax回归、XGBoost四个模型，以投票预测的形式对网络输出结果进行预测。实验结果表明，所提方法能够有效提高对环境音的特征提取能力和深层网络在环境音分类上的抗过拟合能力。

参考文献 | 相关文章 | 多维度评价